package io.renren.hanlp;

import com.hankcs.hanlp.model.crf.CRFLexicalAnalyzer;

import java.io.IOException;

/**
 * @author: xiaomi
 * @date: 2022/1/26
 * @description:
 * 使用条件随机场分词方式
 * https://github.com/hankcs/HanLP/tree/1.x#6-crf%E5%88%86%E8%AF%8D
 */
public class CRFTokenizerSample {

    /**
     *
     * @param args
     * @throws IOException
     */
    public static void main(String[] args) throws IOException {
        CRFLexicalAnalyzer analyzer = new CRFLexicalAnalyzer();
        String[] tests = new String[]{
                "##他说的确实在理",
                "当某些类的全限定名一致时，但是实际上又需要做区分，此时就会起冲突。eg.Tomcat 隔离不同web应用中的代码",
                "商品和服务",
                "上海华安工业（集团）公司董事长谭旭光和秘书胡花蕊来到美国纽约现代艺术博物馆参观",
                "微软公司於1975年由比爾·蓋茲和保羅·艾倫創立，18年啟動以智慧雲端、前端為導向的大改組。" // 支持繁体中文
        };
        for (String sentence : tests)
        {
            System.out.println(analyzer.analyze(sentence));
        }
    }


}
